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(57) Abstract: The invention relates to a 
method for separating sound signals from 
a plurality of sound sources, comprising 
the following steps: arrangement of two 
microphones (MIK1, MIK2) at a given 
distance (d)from each other; detection of 
the sound signals with two microphones 
(MIK1, MIK2) and production of associated 
microphone signals (ml, m2); and 
separation of the sound signal of one of 
the sound sources (SI) from the sound 
signals of other sound sources (S2) based 
on microphone output signals (ml, m2). 
According to the invention, the separation 
step comprises: Fourier transformation of 
the microphone output signals in order to 
determine the frequency spectra thereof 
(Ml, M2); determination of the phase 
difference (F) between the two microphone 
output signals (ml, m2) for each frequency 
component of the frequency spectra thereof 
(Ml, M2);determination of the angle of 
incidence (?) of each sound signal allocated 
to a frequency of the frequency spectra (Ml, 
M2) based on relative phase angle (F) and 
frequency; production of a signal spectrum 
(S) of a signal to be outputted by combining 
one of the two frequency spectra (Ml, M2) 
with a filter function (F<SB>?0</SB>), 
which is selected in such a way, that sound signals from an environment (?3dB> around a preferred angle of incidence (? 0 ) are 
amplified in relation to sound signals from outside said environment (? 3 dB)*» and inverted Fourier transformation of the signal 
spectrum thus produced. 

[Fortsetzung auf der niichsten SeiteJ 
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(57) Zusammenfassung: Bei einem Verfahren zur Separierung von Schallsignalen von einer Mehrzahl von Schailquellen, umfas- 
send die Schiitte: Anordnen von zwei Mikrofonen (MIK1, MIK2) in einem vorbestimmten Abstand (d) zueinander; Erfassen der 
Schallsignale mit beiden Mikrofonen (MIK1, MIK2) und Erzeugen zugeordneter Mikrofonsignale (ml, m2); und Separieren des 
Schallsignals einer der Schailquellen (SI) von den Schallsignalen der anderen Schailquellen (S2) basierend auf den Mikrofonaus- 
gangssignalen (ml, m2), wird vorgeschlagen, dass der Schritt des Separierens umfaBt: Fourier-Transformieren der Mikrofonaus- 
gangssignale zur Ermit tiling ihrer Frequenzspektren (Ml, M2); Bestimmen der Phasendifferenz (<j>) zwischen den beiden Mikro- 
fonausgangssignalen (ml, m2) flir jede Frequenzkomponente ihrer Frequenzspektren (Ml, M2); Bestimmen des Einfallswinkels 
(5) jedes einer Frequenz der Frequenzspektren (Ml, M2) zugeordneten Schallsignals basierend auf dem relativen Phasenwinkel (<|>) 
und der Frequenz; Erzeugen eines Signalspektrums (S) eines auszugebenden Signals durch Verkntlpfen eines der beiden Frequenz- 
spektren (Ml, M2) mit einer Filterfunktion (Fgo), die derart gewahlt ist, dass Schallsignale aus einer Umgebung (Y 3 dB) um einen 
bevorzugten Einfallswinkel (6o) herum relauv zu Schallsignalen von auBerhalb dieser Umgebung (y 3dB ) verstarkt werden; und inver- 
ses Fourier-Transformieren des derart erzeugten Signalspektrums. 
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Verfahren und Vorrichtung zur Separierung von Schallsignalen 

Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zur 
Separierung von Schallsignalen. 

Die Erfindung liegt auf dem Gebiet der digitalen Signalverarbeftung zum 
Entmischen verschiedener akustischer Signale aus unterschiedlichen 
Raumrichtungen, welche mit zwei Miknofbnen in bekanntem Abstand stereo 
aufgenommen werden. 

Das Gebiet der Quellentrennung, auch „beam forming 0 genannt, erfahrt 
wachsende Bedeutung durch die Zunahme der mobilen Kommunikatlon sowie der 
automatischen Verarbeitung menschlicher Sprache. In sehr vielen Anwendungen tritt 
das Problem auf, dass das gewunschte Sprachsignal (Nutzsignal) durch 
verschiedene Storeinflusse beeintrachtigt ist. Hier sind hauptsachlich Storungen 
durch Hintergrundgerausche, Storungen durch andere Sprecher sowie Storungen 
durch Lautsprecherausgaben von Musik oder Sprache zu nennen. Die 
verschiedenen Storeinflusse erfordern je nach Ihrer Art und nach der Vorkenntnis 
uber das Nutzsignal unterschiedliche Behandiungen. 

Beispielhafte Anwendungen der Erfindung finden sich also in 
Kommunikationseinrichtungen, in denen die Position eines Sprechers bekannt ist, 
und in denen Storungen durch Hintergrundgerausche Oder andere Sprecher sowie 
Lautsprecherausgaben vorhanden sind. Anwendungsbeispiele sind Kfz- 
Freisprecheinrichtungen, in denen die Mikrofone z.B. im Ruckspiegel untergebracht 
sind und eine sogenannte Richthyperbel auf den Fahrer gerichtet wird. In dieser 
Anwendung kann eine zweite Richthyperbel auf den Beifahrer gerichtet werden, so 
dass wahrend eines Telefongesprachs gezielt zwischen Fahrer und Beifahrer hin- 
und hergeschaltet werden kann. 

In Fallen, in denen die geometrische Position der Nutzsignalquelle zu den 
aufnehmenden Mikrofonen bekannt ist, ist die geometrische Quellenseparation ein 
machtiges Werkzeug. Das Standardverfahren dieser Klasse von „beam forming"- 
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Algorithmen ist das sog. „shift and add" Verfahren, bei welchem auf eines der 
Mikrofonsignale ein Filter angewendet wird, und das gefilterte Signal sodann zum 
zweiten Mikrofonsignal hinzuaddiert wird (siehe z.B. Haddad und Benoit, 
lt Capabilities of a beamfomning technique for acoustic measurements inside a moving 
car", The 2002 International Congress and Exposition On Noise Control Engineering, 
Deaborn, Mi, USA, August 19-21, 2002). 

Eine Erweiterung dieses Verfahrens beschaftigt sich mit n adaptiven beam 
forming" bzw. n adaptiver Quellensepatation", wo die Lage der Quellen im Raum a 
priori unbekannt ist und durch die Algorithmen erst ermittelt werden muss (WO 
02/061732, US6,654,719). Hier ist es das Ziel, die Lage der Quellen im Raum aus 
den Mikrofonsignalen zu bestimmen und nicht, wie beim „geometrischen tt beam 
forming, fest vorzugeben. Adaptive Verfahren erweisen sich zwar als nutzlich, 
allerdings ist auch hier gewohnlich a-priori-lnforrnation erforderlich, da ein 
Algorithmus in der Regel nicht entscheiden kann, welche der detektierten 
Sprachquellen Nutz- und welche Storsignal ist. Nachteilig bei alien bekannten 
adaptiven Verfahren ist die Tatsache, dass die Algorithmen eine gewisse 
Adaptionszeit benotigen, bevor ausreichende Konvergenz besteht und die 
Quellentrennung gelingt. AufSendem sind adaptive Verfahren prinzipiell anfalliger fur 
diffuse Hintergrundstorungen, da diese die Konvergenz erhebiich beeintrachtigen 
konnen. Ein gravierender Nachteil beim klassischen „shifi and add M -Verfahren ist die 
Tatsache, dass sich mit zwei Mikrofonen lediglich zwei Signalquellen voneinander 
separieren lassen und die Dampfung von diffusem Hintergrundschall in der Regel 
nicht in ausreichendem MalJe gelingt. 

Aus der DE 69314514 T2 ist ein Verfahren zur Separierung von 
Schallsignalen gemafi dem Oberbegriff von Anspruch 1 bekannt. Das in diesem 
Dokument vorgeschlagene Verfahren fuhrt eine Separation der Schallsignale 
dergestalt durch, dass ein gewunschtes Nutzschallsignal von Umgebungsrauschen 
befreit wird, und nennt als Anwendungsbeispiele die Sprachsignale eines 
Fahrzeuginsassen, die auf Grund des allgemeinen und nicht tokalisierten 
Fahrzeuglarms nur schwer verstandlich sind. 
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Zum Herausfiltern des Sprachsignals schlagt dieses Dokument des Stands 
der Technik vor, mlt Hilfe von zwei Mikrophonen jeweils ein Gesamtschallsignal zu 
messen, jedes der beiden Mikrophonsignale zur Ermittlung seines 
Frequenzspektrums einer Fouriertransfbrmation zu unterziehen, in mehreren 
Frequenzbandern basierend auf der jeweiligen Phasendifferenz einen Einfallswinkel 
des jeweiligen Signals zu bestimmen, und schlielilich die eigentliche "Rlterung" 
vorzunehmen. Hierzu wind ein bevorzugter Einfallswinkel bestimmt, und dann eine 
Filterfunktion, namlich ein Rauschspektrum, von einem der beiden Frequenzspektren 
subtrahiert, wobei dieses Rauschspektrum derart gewahlt ist, dass Schallsignale aus 
der Umgebung des bevorzugten Einfallswinkels, der dem Sprecher zugeordnet ist, 
relativ zu den anderen Schallsignalen, die im wesentlichen Hintergrundlarm des 
Fahrzeugs darstellen, verstarkt werden. Das derart gefilterte Frequenzspektrum wird 
anschlieftend einer inversen Fourier-Transformation unterzogen und als gefiltertes 
Schailsignal ausgegeben. 

Das in der DE 69314514 T2 offenbarte Verfahren leidet an mehreren 
Nachteilen: 

a) Die Schallsignalseparation gemafJ diesem Dokument des Stands der 
Technik basiert auf dem vollstandigen Entfemen eines Anteils des 
ursprunglich gemessenen Gesamtschallsignals, namlich demjenigen 
Anteil, der als Rauschen bezeichnet wird. Dieses Dokument geht 
namlich von einem akustischen Szenario aus, bei dem nur eine 
einzige Nutzschallquelle vorhanden 1st, deren Signale gleichsam 
eingebettet sind in Storsignale von nicht beziehungsweise weniger 
lokalisierten Quellen, insbesondere Fahrzeuglarm. Das Verfahren 
gemad diesem Dokument des Stands der Technik erlaubt daher 
ausschlieGlich das Herausfiltern dieses einen Nutzsignals durch 
vollstandiges Eliminieren aller Rauschsignale. 

In Fallen mit einem einzigen Nutzschallsignal mag das Verfahren 
gemaft dieses Dokuments zufriedenstellende Ergebnisse liefem. Es 
kann jedoch auf Grund seines Grundprinzips nicht sinnvoll in 
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Sttuationen eingesetzt werden, in denen nicht nur eine 
Nutzschallquelle, sondem mehrere derartige Quellen zum 
Gesamtschallsigna! beltragen. Dies liegt insbesondere daran, dass 
gemaS dieser Lehre nur ein einziger sog. dominanter Ankunttswinkel 
verarbeitet werden kann, namlich derjenige Einfallswinkel, unter dem 
das energiereichste Schallsignal einfallt. Alle Signale, die unter 
anderen Ankunftswinkeln auf die Mikrophone fallen, werden 
zwangslaufig als Rauschen behandelt. 

b) Oaruber hinaus scheint dieses Dokument selbst davon auszugehen, 
dass die dort vorgeschlagene Filterung in Form einer Subtraktion des 
Rauschspektrums von einem der beiden Frequenzspektren noch keine 
zufriedenstellenden Ergebnisse liefert. Daher sieht dieses Dokument 
zusatzlrch, namlich unmittelbar vor dieser eigentlichen Filterung, noch 
eine weitere Signalverarbeitung vor: Es werden namlich in alien 
Frequenzbandem, nachdem der dominante Einfallswinkel bestimmt 
worden ist, durch entsprechende Phasenverschiebung eines der 
beiden fourier-transformierten Schallsignale in diesem Frequenzband 
die Rauschanteile im jewelligen Frequenzband relativ zu den in 
diesem Frequenzband mdglicherweise ebenfalls enthaltenen 
Nutzschallsignalen abgeschwacht. Somit sieht dieses Dokument die in 
ihr offenbarte Filterung in Form einer Subtraktion des 
Rauschspektrums offenbar selbst als ungenugend an, so dass sie 
selbst weitere, namlich unmittelbar vorhergehende 
Slgnalverarbeitungsschritte vorschlagt, die durch hierfur gesondert 
bereitgestellte Bauteile vorgenommen werden. Insbesondere bendtigt 
das System zusatzlich zu einer Rauschspektrumsubtraktions- 
vorrichtung (Vorrichtung 24 in der elnzigen Flgur dieses Dokuments) 
vorgeschaltete Mittel 20 zur Phasenverschiebung sowie Mittel 21 zur 
phasenrichtigen Addition von Spektren in den einzelnen 
Frequenzbandem (vergleiche die entsprechenden Bauteile in der 
einzigen Figur dieses Dokuments). 
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Hierdurch werden das Verfahren und die zu seiner Durchfiihrung 
erfbrderliche Vorrichtung aufwendig. 

Es 1st daher Aufgabe der vorliegendeh Erfindung, ein Verfahren zur 
Separierung von Schallsignalen von einer Mehrzahl von Schallquellen sowie eine 
entsprechende Vorrichtung vorzuschlagen. die durch den reinen Filterschritt eine 
ausreichende Qualitat der Ausgangssignale erzeugen, ohne zuvor eine 
phasenrichtige Addition von Schallspektren in verschiedenen Frequenzbandern 
durchfuhren zu miissen, um eine zufriedenstellende Separierung zu erzielen, und die 
es femer erlaubt, nicht nur Signale einer einzigen Nutzschallquelle von alien anderen 
Schallsignalen zu befreien, sondem grundsatzlich in der Lage ist, Schallsignale von 
einer Mehrzahl von Schallquellen ohne Eliminierung separat auszugeben. 

Erfindungsgemaft wird diese Aufgabe durch ein Verfahren nach Anspruch 
1 bzw. eine Vorrichtung nach Anspruch 7 gelost Vorteilhafte Weiterbildungen der 
Erfindung sind in den jeweiligen Unteranspruchen definiert 

Das erfindungsgemafte Verfahren bendtigt keine Konvergenzzeit und 
kann mit zwei Mikrofonen mehr als zwei Schallquellen im Raum separierbaren, 
sofem diese in ausreichendem Mafie raumlich getrennt sind. Das Verfahren stellt nur 
geringe Anforderungen an Speicherbedarf und Rechenleistung, und es ist sehr stabil 
gegenuber dlffusen Storsignalen. Anders als beim herkommlichen beam forming 
lassen sich solche diffusen Storungen effektiv dampfen. Wie bei alien Zwei-Mikrofon- 
Verfahren sind die Raumbereiche, zwischen denen das Verfahren differenzieren 
kann, rotationssymmetrisch zur Mikrofon-Achse, d.h. zu der Geraden, welche durch 
die beiden Mikrofonpositionen definiert ist. In einem Schnitt durch den Raum, 
welcher die Symmetrieachse enthalt, entspricht der Raumbereich, in dem sich eine 
Schallquelle befinden muss um als Nutzsignal betrachtet zu werden, einer Hyperbel. 
Der Winkel S 0 . den der Scheitel der Hyperbel zur Symmetrieachse einnimmt, ist frei 
wahlbar, und die Breite der Hyperbel, welche durch einen Winkel y 3 db bestimmt wird, 
ist ebenfalls ein wahlbarer Parameter. Mit nur zwei Mikrofonen lassen sich 
gleichzeitig Ausgangssignale zu beliebigen, verschiedenen Winkeln d 0 erzeugen, 
wobei die Trennscharfe zwischen den Bereichen mit dem Uberlappungsgrad der 
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entsprechenden Hyperbeln abnimmt Schallquellen innerhalb einer Hyperbel werden 
als Nutzsignale betrachtet und mit weniger als 3 db gedampft Storsignale werden in 
Abhangigkeit ihres Einfallswinkels 8 eliminiert, wobe! eine Dampfung von >25db fur 
Einfallswinkel » auBerhalb der Akzeptanzhyperbel erreichbar ist. 

Das Verfahren arbeitet im Frequenzbereich. Das einer Richthyperbel 
zuzuordnende Signalspektrum entsteht durch Multiplikation einer Korrekturfunktion 
K2(x1) sowie einer Filterfunktion F(f.T) mit dem Signalspektrum M(f,T) eines der 
Mikrofone. Die Filterfunktion entsteht durch spektrale Glattung (z.B. durch Diffusion) 
einer Zuordnungsfunktion Z(S-S 0 ), wobei im Argument der Zuordnungsfunktion der 
berechnete Einfallswinkel d einer spektralen Signalkomponente steht. Dieser 
Einfallswinkel & wird aus dem Phasenwinkel <pdes komplexen Quotienten der 
Spektren der beiden Mikrofonsignale, M2(f,T)/M1(f,T), ermittelt, indem man cp mit der 
Schallgeschwindigkeit c multipliziert und durch 27tfd dividiert, wobei d den 
Mikrofonabstand bezeichnet. Das Engebnis xi= (pc/27tfd, welches zugleich das 
Argument der Korrekturfunktion K2(x1) ist, liefert nach Beschrankung x=K1(x1) auf 
einen Betrag kleiner oder gleich eins den Kosinus des Einfallswinkels ^, welcher im 
Argument der Zuordnungsfunktion Z(&-d 0 ) steht; K1(x1) bezeichnet dabei eine 
weitere Korrekturfunktion. 

Kurzbeschreibung der Abbildungen: 

Fig. 1 zeigt die Definition des Einfallswinkels 3 durch die Positionen 
beiden Mikrofone. deren Signale verarbeitet werden. 

Fig. 2 zeigt beispielhaft eine Zuordnungsfunktion Z(£>) mit 
Halbwertsbreite 2y 3d b, aus welcher eine Hyperbel mit Scheitel bei d=0 resultiert. 

Fig. 3 zeigt eine Hyperbel mit Scheitel bei 3=do, die die 
Richtcharakteristik der Quellenseparation bestimmt. Signale innerhalb des durch die 
Hyperbel definierten Raumbereichs werden mit einer Dampfung <3db als Nutzsignal 
ausgegeben 
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Fig. 4 zeigt den Aufbau des Quellenseparators, in welchem die 
Zeitsignale zweler Mikrofone, m1(t) und m2(t), in einer Stereo-Abstast- und -Fourier- 
Transformator-Einheit (20) zu Spektren M1(f,T) und M2(f,T) Iransformiert werden, 
wobei T den Zeitpunkt der Entstehung der Spektren bezeichnet. Aus den Spektren 
wind in der S-Berechnungseinheit (30) der frequenzabhangige Einfallswinkel B(f,T) 
sowie das korrigierte Mikrofonspektrum M(f,T) berechnet, woraus in 
Signalgeneratoren (40) fur verschiedene Richtwinkel B 0 Ausgangssignale s s0 (t) 
entstehen. 

Fig. 5 zeigt den Aufbau der 9-Berechnungseinheit (30), in welcher der 
Phasenwinkel <p(f,T) einer spektralen Komponenten des komptexen Quotienten der 
beiden Mikrofonspektren M1(f,T) und M2(f,T) berechnet wird, welcher sodann mit der 
Schallgeschwindigkeit c zu muttiplizieren und durch 27tfd zu dividieren ist, wobei d 
den Mikrofonabstand bezeichnet. Bel dieser Operation entsteht die Grdfie x1(f,T). 
welche das Argument der beiden Korrekturfunktionen K2 und K1 darsteltt Mit diesen 
Korrekturfunktionen entsteht das korrigierte Mikrofonspektrum 
M(f.T)=Ml(f,TrK2(x1(f,T)) sowie die Grolie x(f,T)=K1(x1(f,T)). aus welcher durch 
Anwendung der Arcuskosinus-Funktion der Einfallswinkel »(f,T) zu berechnen ist. 

Fig. 6 zeigt einen Signalgenerator, in welcher eine Zuordnungsfunktion 
Z(d-So) mit einem einstellbaren Winkel do durch spektrale Diffusion zu einer 
Filterfunktion F(f,T) geglattet wird, welche mit dem korrigierten Mikrofonspektrum 
M(f f T) multiplizieren ist Daraus resultiert ein Ausgangsspektrum Sao (f.T), aus 
welchem durch inverse Fouriertransformation ein Ausgangssignal Sao(t) entsteht, 
welches die Schallsignale innerhaib des durch die Zuordnungsfunktion Z und den 
Winkel d 0 festgelegten Raumbereichs enthalt. 

Fig. 7 zeigt exemplarisch die beiden Korrekturfunktionen K2(x1) und 

K1(x1). 
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Ein Grundgedanke der Erfindting ist es, jeder spektralen Kornponente des 
einfallenden Signals zu jedem Zeitpunkt T einen Einfallswinkel S zuzuordnen und 
allein anhand des berechneten Einfallswinkels zu entschetden, ob die entsprechende 
Schallquelle innerhalb einer gewiinschten Richthyperbel liegt, Oder nicht. Um die 
Zugehorigkeitsentscheidung etwas abzumlldern, wird anstatt einer harten Ja/Nein- 
Entscheidung eine ..weiche" Zuordnungsfunktion Z(») (Fig. 2) benutzt, die einen 
kontinuierlichen Ubergang zwischen erwunschten und unerwiinschten 
Einfallsrichtungen erlaubt, was sich vorteilhaft auf die Integritat der Signale auswirkt. 
Die Breite der Zuordnungsfunktion entspricht dann der Breite der Richthyperbel (Fig. 
3). Durch Division der komplexen Spektren der beiden Mikrofonsignale wird 
zunachst fiir jede Frequenz f zu einem Zeitpunkt T die Phasendifferenz <p berechnet. 
Mit Hilfe der Schallgeschwindigkeit c und der Frequenz f der entsprechenden 
Signalkomponente lasst sich aus der Phasendifferenz ein Wegunterschied 
berechnen, der zwischen den beiden Mikrofonen liegt, wenn das Signal von einer 
Punktquelle ausgesandt wurde. Ist der Mikrofonabstand d bekannt, ergibt eine 
einfache geometrische Uberfegung, dass der Quotient x1 aus Wegunterschied und 
Mikrofonabstand dem Kosinus des gesuchten Einfallswinkels entspricht. In der 
Praxis ist aufgrund von Storungen wie diffusem Storschall oder Raumhall die 
Annahme einer Punktquelle selten erfiillt, weshalb x1 gewdhnlich nicht auf den 
erwarteten Wertebereich [-1,1] beschrankt ist. Bevor der Einfallswinkel & berechnetet 
werden kann f ist daher noch eine Korrektur erforderlich, die x1 auf das genannte 
Intervall beschrankt. Wurde zum Zeitpunkt T fur jede Frequenz f der Einfallswinkel 
9(f,T) bestimmt, ergibt sich das Spektrum des gewiinschten Signals innerhalb einer 
Richthyperbel mit Scheitel beim Winkel 3=d 0 durch einfache frequenzweise 
Multiplikatlon mit dem Spektrum eines der Mikrofone, also M1(f t T)K(S(f,T)- d 0 ). Unter 
Umstanden ist es vorteilhaft, K(S(f,T)- ^o) vor Ausfuhrung der Multiplikation spektral 
zu glatten. Eine Glattung, deren Ergebnis als Fso(f,T) bezeichnet sei, erhatt man z.B. 
durch Anwendung elnes Dfffusionsoperators. In Fallen, in denen durch Storeinflusse 
die Grolie x, die zur Berechnung des Einfallswinkels dient, auBerhalb ihres 
Wertebereichs liegt, ist es vorteilhaft, die entsprechende spektrale Kornponente des 
Mikrofonsignals abzuschwachen, da zu vermuten ist, dass sich Storsignale 
uberlagert haben. Dies geschieht z.B. durch Anwendung einer Korrekturfunktion, 
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deren Argument die GrdfJe x1 ist Sei M(f,T) das konigierte Mikrofonsignal, dann 
schreibt sich die Erzeugung des gewunschten Signalspektrums inklusive spektraler 
Glattung und Korrektur als Sa 0 (f f T)=F8o(f,T)M(f.T). Aus S$o(f.T) ensteht durch inverse 
Fouriertransformation das Zeitsignal s M (t) fur die entsprechende Richthyperbel mit 
Scheitelwinke! O 0 . 

Anders ausgedruckt ist es eine Grundidee der Erflndung, verschiedene 
Schallquellen, beispielsweise den Fahrer und den Beifahrer in einem Kraftfahrzeug, 
raumlich voneinander zu unterscheiden und somit beispielsweise das Nutz- 
Sprachsignal des Fahrers vom Stor-Sprachsignal des Belfahrers zu separieren, 
indem man die Tatsache ausnutzt, dass diese beiden Sprachsignale, also 
Schalisignale, in der Regel auch bei unterschiedlichen Frequenzen voriiegen. Die 
erfindungsgemafi vorgesehene Frequenzanalyse eriaubt also zunachst, das 
Gesamt-Schallsigna! in die zwei Einzel-Schallsignale (namlich vom Fahrer und vom 
Beifahrer) aufzuspalten. Es mull dann "nur noch" mit Hilfe geometrischer 
Oberlegungen anhand der jeweiligen Frequenz jedes der beiden Schalisignale und 
der zu ermittelnden Phasendifferenz zwischen dem Ausgangssignal des Mikrofons 1 
und des Mikrofons 2, die jeweils diesem Schallsignal zugeordnet sind, die 
Einfallsrichtung jedes der beiden Schalisignale berechnet werden. Da die Geometrie 
zwischen beispielsweise der Position des Fahrers, der Position des Beifahrers und 
der Position der Mikrofone, etwa in einer Freisprecheinrichtung im Kraftfahrzeug, 
bekannt ist, kann dann das weiter zu verarbeitende Nutz-Schallsignal aufgrund 
seines anderen Einfallswinkels vom Stor-Schallsignal separiert werden. 

Es folgt ein detailliertes Ausfuhrungsbeispiel der Erfindung, das anhand 
der Abbildungen beschrieben wird. 

Die Zeitsignale ml (t) und m2(t) zweier Mikrofone, die einen festen 
Abstand d zueinander haben, werden einem Rechenwerk (10) zugefiihrt (Fig. 4), wo 
sie in einer Stereo-Abtast- und -Fourier-Transformator-Einheit (20) mit einer 
Abtastrate f A diskretisiert und digitalisiert werden. Eine Folge von a Abtastwerten 
jeweils eines der Mikrofbnsignale m1(t) und m2(t) wird durch Fourier-Transformation 
zum komplexwertigen Spektrum M1(f,T) bzw. M2(f,T) transfomniert, wobei f die 
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Frequenz der jeweiligen Signalkomponente bezeichnet, und T den Zeitpunkt der 
Entstehung eines Spektrums angibt. Fur die praktische Anwendung ist folgende 
Parameterwahl geeignet: fA =11025 Hz, a=256, T a/2=L Wenn Rechenleitung und 
Speicherplatz es erlauben, ist jedoch a=1024 zu bevorzugen. Der Mikrofonabstand d 
sollte kleiner sein als die halbe Wellenlange der hochsten zu verarbeitenden 
Frequenz, welche slch aus der Abtastfrequenz ergibt, d.h. d < c/4f A . Fur die oben 
angegebene Parameterwahl eignet sich ein Mikrofonabstand d = 20 mm. 

Die Spektren M1(f,T) und M2(f,T) werden einer d-Berechnungseinheit mit 
Spektrum-Korrektur (30) zugefuhrt, die aus den Spektren M1(f f T) und M2(f,T) einen 
Einfallswinkel S(f,T) berechnet, der angibt, aus welcher Richtung relativ zur 
Mikrofonachse eine Signalkomponente mit Frequenz f zum Zeitpunkt T in die 
Mikrofone einfaltt (Fig.1). Dazu wird M2(f,T) durch M1(f,T) komplex dividiert. <p(f f T) 
bezeichne den Phasenwinkei dieses Quotienten. Wo Verwechslungen 
ausgeschlossen sind, wird im foigenden das Argument (f,T) der zeit- und 
frequenzabhangigen G rotten fortgelassen. Die genaue Rechenvorschrift zur 
Bestimmung von 9 lautet gemali der Eulerschen Formel und den Rechenregeln fur 
komplexe Zahlen: 

9=arctan((Re1 *lm2-lm1*Re2)/(Re1 *Re2+lm1 *lm2)), 

wobei Re1 und Re2 die Realteile und Im1 und Im2 die Imaginarteile von M1 bzw. M2 
bezeichnen. Die Gro&e x1=<pc/27cfd entsteht mit Hilfe der Schallgeschwindigkeit c aus 
dem Winkel <p, auch x1 ist frequenz- und zeitabhangig: x1=x1(f f T). Der Wertebereich 
von x1 muss in der Praxis mit Hilfe einer Korrekturfunktion x=K1(x1) (Fig. 7) auf das 
Intervall [-1,1] beschrankt werden. Auf die so berechnete GroBe x wird durch 
Anwendung der Arcuskosinus-Funktion ein Einfallswinkel 9 der betrachteten 
Signalkomponente errechnet, welcher von der Mikrofonachse zu messen ist, d.h. von 
der durch die Positionen der beiden Mikrofone definierten Geraden (Fig. 1). Unter 
Berucksichtigung aller Abhangigkeiten lautet damit der Einfallswinkel einer 
Signalkomponente mit Frequenz f zum Zeitpunkt T: ^(f.t^arccosMf.T))- Des 
weiteren wird mit Hilfe einer zweiten Korrekturfunktion K2(x1 ) das Mikrofonspektrum 
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korrigiert (Fig. 7): M(f,T)=K2(x1)M1(f,T). Diese Korrektur dient dazu, in Fallen, in 
denen die erste Korrekturfunktion greift, die entsprechende Signalkomponente zu 
reduzieren, da zu vermuten ist, dass sich Storungen uberlagert haben, die das Signal 
verfalschen. Die zwefte Korrektur ist optional, alternativ kann auch M(f,T)=M1(f,T) 
gewahlt werden; M(f,T)=M2(f,T) ist ebenfalls moglich. 

Das Spektrum M(f,T) wind zusammen mit dem Winkel 9(f.T) einem oder 
mehreren Signalgeneratoren (40) zugefuhrt, wo mit Hilfe einer Zuordnungsfunktion 
Z(S) (Fig. 2) und einem wahlbaren Winkel do jewells ein auszugebendes Signal s 3 o(t) 
entsteht. Dies geschieht, indem zu einem Zeitpunkt T jede spektrale Komponente 
des Spektrums M(f t T) mit der entsprechenden Komponente eines &o-spezifischen 
Filters Fao(f.T) multipliziert wind. Fao(f,T) entsteht durch spektrale Glattung von Z(S- 
&o), Diese Glattung erfolgt z.B. durch spektrale Diffusion: 

FaoCf.T) = Z(3(f,T)-So) + DA 2 f Z(S(f Jh&o). 

Dabei bezeichnet D die Diffusionskonstante, welche ein frei wahlbarer 
Parameter grafter oder gleich null ist. Der diskrete Diffusionsoperators A 2 f ist eine 
Abkurzung fur 

A 2 f Z(S(f,T>»o)) = (Z(3(f- fA/a),T)-d 0 )-2Z(»(f,T)-&o))+Z(d(f+ fA/a,T)-do))/(fA/a) 2 . 

Der auftretende Quotient f^/a aus Abtastrate f A und Anzahl a der 
Abtastwerte entspricht dem Abstand zweier Frequenzen im diskreten Spektrum. 
Durch Anwendung des so erzeugten Filters F&o(f,T) entsteht ein Spektrum 
Sao(f,T)=Fso(f,T)M(f,T). welches durch inverse Fouriertransformation in das Zeitslgnal 
s$o(t) ubergeht. 

Das von einem Signalgenerator (40) auszugebene Signal sao(t) entspricht 
dem Schallsignal innerhalb desjenigen Raumbereichs, der durch die 
Zuordnungsfunktion Z(9) und den Winkel do definiert ist. Der Einfachhett halber wind 
in der gewahtten Nomenklatur fur verschiedene Signalgeneratoren nur von einer 
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Zuordnungsfunktion Z(9) ausgegangen, verschiedene Signalgeneratoren benutzen 
lediglich verschiedene Winkel So- Praktisch spricht naturlich nichts dagegen, in 
jedem Slgnalgenerator auch eine eigene Form der Zuordnungsfunktion zu wahlen. 
Die Anwendung von Zuordnungsfunktionen, welche iiber die ZugehSrigkeit von 
Signalkomponenten zu verschiedenen Raumbereichen entscheiden, ist einer der 
zentraien Gedanken der Erfindung. Eine Zuordnungsfunktion muss eine gerade 
Funktion sein, geeignete Funktionen sind z.B. Z(S)=((1 +cosS)/2) n mit einem 
Parameter n>0. Der Raumbereich, in weichem Signale mit weniger als 3db gedampft 
werden, entspricht einer Hyperbel mit Offnungswinkel 2y3db (Fig. 3) und Scheitel bei 
dem Winkel d 0 . Hierbei entspricht 2y3db dem Halbwertswinkel der 
Zuordnungsfunktion Z(Q) (Fig. 2), mit der angegebenen Formel fur die 
Zuordnungsfunktion gilt y3db=arc cos(2 11/n -1 ). Bei diesen zweidimensionalen 
geometrischen Uberlegungen ist zu beachten, dass der tatsachliche Bereich des 
dreidimensionalen Raums, aus weichem mit dem beschriebenen Verfahren 
Schallsignale extrahiert werden, ein Rotationshyperboloid ist, der durch Rotation der 
beschriebene Hyperbel um die Mikrofonachse entsteht. 

Selbstverstandlich ist die vorliegende Erfindung nicht auf den Einsatz in 
Kraftfahrzeugen und Freisprecheinrichtungen beschrankt: Weitere Anwendungen 
sind Konferenz-Telefonanlagen, bei denen mehrere Richthyperbeln in verschiedene 
Raumrichtungen geiegt werden, um die Sprachsignale einzelner Personen zu 
extrahieren und Ruckkopplungen bzw. Echo-Effekte zu vermeiden. Des werteren 
lasst sich das Verfahren mit einer Kamera kombinieren, wobei die Richthyperbel 
stets in die gleiche Richtung blickt wie die Kamera, und so nur aus dem Bildbereich 
kommende Schallsignale aufgezeichnet werden. In Bildtelefonsystemen ist mit der 
Kamera zugleich ein Monitor verbunden, in den die Mlkrofonanordnung ebenfalls 
eingebaut werden kann, um eine Richthyperbel senkrecht zur Monitor-Oberflache zu t 
generieren, denn es ist zu erwarten, dass sich der Sprecher vor dem Monitor 
befindet. 

Eine ganz andere Klasse von Anwendungen ergibt sich, wenn man anstatt 
des auszugebenden Signals den ermittelten Einfallswinkel S> auswertet, indem man 
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z.B. zu einem Zeitpunkt T uber Frequenzen f mittelt. Ein solche S(T)-Auswertung 
kann zu Uberwachungszwecken benutzt werden, wenn innerhalb eines ansonsten 
aihigen Raums die Position einer Schallquelle geortet werden soil. 

5 Das richtige "Ausschneiden" des gewunschten Bereichs entsprechend 

dem zu separierenden Nutz-Schallsignal aus einem Mikrofonspektrum muss nicht, 
wie in Figur 6 beispielhaft gezeigt, durch Multiplikation mit einer Filterfunktion 
erfolgen, deren Zuordnungsfunktion den in Figur 2 gezeigten beispielhaften Verlauf 
hat. Jede andere Art der Verknupfung des Mikrofonspektrums mit einer Filterfunktion 
10 ist geeignet, solange diese Filterfunktion und diese Verknupfung dazu fuhren, dass 
Werte im Mikrofonspektrum umso starker "gedampfT werden, je weiter ihr 
zugeordneter Einfallswinkel d vom bevorzugten Einfailswinkel do (beispielsweise der 
Richtung des Fahrers im Kraftfahrzeug) entfernt ist. 
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Bezugszeichenliste: 

10 Rechenwerk zur Durchfuhrung der erfindungsgemalien 

Verfahrensschritte 
20 Stereo-Abtast- und -Fourier-Transformator-Einheit 
30 S-Berechnungseinheit 
40 Signalgenerator 

a Anzahl der Abtastwerte, die zu Spektren M1 bzw. M2 transformiert 

werden 
d Mikrofonabstand 

D Diffusionskonstante, wahlbarer Parameter grolier Oder gleich Null 

A 2 f Diffusionsoperator 

f Frequenz 

f A Abtastrate 

K1 erste Korrekturfunktion 

K2 zweite Korrekturfunktion 

ml (t) Zeitsignal des ersten Mikrofons 

m2(t) Zeitsignal des zweiten Mikrofons 

M1(f,T) Spektrum zum Zeitpunkt T des ersten Mikrofonsignals 

M2(f,T) Spektrum zum Zeitpunkt T des zweiten Mikrofonsignals 

M(f f t) Spektrum zum Zeitpunkt T des korrigierten Mikrofonsignals 

sso(t) erzeugtes Zeitsignal, entsprechend einem Winkel » 0 der 

Richthyperbel 
Sao(f ,T) Spektrum des Signals smW 

Y3db Winkel, welcher die Halbwertsbrette einer Zuordnungsfunktion 
Z(&) bestimmt 

cp Phasenwinkel des komplexen Quotienten M2/M1 
S(f,T) Einfallswinkel einer Signalkomponente, gemessen von der 
Mikrofonachse 

S 0 Winkel des Scheitels einer Richthyperbel, Parameter in Z(S-S 0 ) 
x, x1 ZwischengroBen bei der O-Berechnung 
t Zeitbasis der Signalabtastung 
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T Zeitbasis der Spektrumerzeugung 
Z(S) Zuordnungsfunktion 
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Anspruche 

1 . Verfahren zur Separieaing von Schallsignalen von einer Mehrzahl von 
Schallquellen (S1 , S2), umfassend die Schritte: 

- Anordnen von zwei Mikrofonen (MIK1, MIK2) in einem vorbestimmten 
Abstand (d) zueinanden 

- Erfassen der Schallsignale mit beiden Mikrofonen (MIK1, MIK2) und 
Erzeugen zugeordneter Mikrofonsignale (ml , m2); und 

- Separieren des Schallsignals einer der Schallquellen (S1) von den 
Schallsignalen der anderen Schallquellen (S2) basierend auf den 
Mikrofonsignalen (ml , m2), 

wobei der Schritt des Separierens die Schritte umfafit: 

- Fourier-Transformieren der Mikrofonsignale zur Ermittlung ihrer 
Frequenzspektren (M1 , M2); 

- Bestimmen der Phasendifferenz (<p) zwischen den beiden 
Mikrofonsignalen (ml, m2) fur jede Frequenzkomponente ihrer 
Frequenzspektren (M1 , M2); 

- Bestimmen des Einfallswinkels (&) jedes einer Frequenz der 
Frequenzspektren (M1, M2) zugeordneten Schallsignals basierend auf 
der Phasendifferenz (<p) und der Frequenz; 

- Erzeugen eines Signalspektrums (S) eines auszugebenden Signals 
durch Verknupfen eines der beiden Frequenzspektren (M1, M2) mit einer 
Filterfunktion (FsoX die derart gewahlt ist, dass Schallsignale aus einer 
Umgebung (y 3 dB> um einen bevorzugten Einfallswinkel (So) herurn relativ 
zu Schallsignalen von aulierhalb dieser Umgebung (y3<ib) verstarkt 
werden; und 

- Inverses Fourier-Transformieren des derart erzeugten Signalspektrums, 
dadurch gekennzeichnet, dass die Filterfunktion (F so ) 3-abhangig ist und 

unter Variation von S ein Maximum bei dem bevorzugten Einfallswinkel (d 0 ) aufweist, 
und die Verkniipfung der Filterfunktion (F^o) mit einem der beiden Frequenzspektren 
eine Multiplikation derselben umfasst. 
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2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die 
Filterfunktion (Fao) die Form aufweist: 

F3o(tT)=Z(»-»o)+ DA 2 f Z(S-»o) 

wobei 

f die jeweilige Frequehz 

T der Zeitpunkt der Ermittlung der Frequenzspektren (M1 , M2) 
Z(S-So) eine Zuordnungsfunktion mit Maximum bei So 
D £ 0 eine Diffusionskonstante, und 
A 2 f ein diskreter Diffuslonsoperator ist. 

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die 
Zuordnungsfunktion (Z) die Form aufweist: 



wobei n > 0 ist. 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch 
gekennzeichnet, dass die Bestimmung des Einfallswinkels Q tiber die Beziehung 



wobei 

<p die Phasendifferenz zwischen den beiden Mikrofonsignalkomponenten 




3=arc cos(x(f,T)) 



erfolgt mit 



x (f > T)= 9 c/27tfd 



(ml, m2) 



c die Schallgeschwindigkeit 

f die Frequenz der Schallsignalkomponente und 

d der vorbestimmte Abstand der beiden Mikrofone (MIK1, MIK2) ist. 



5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass es femer 
den Schritt umfasst: 

Begrenzen des Werts von x(f,T) auf das Intervall [-1 , 1]. 
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6. Verfahren nach Anspaich 5, dadurch gekennzeichnet, dass es ferner 
deh Schritt umfasst: 

Reduzieren von Stgnalkomponenten, fur die der Wert von x(f,T) vor der 
Begrenzung aufierhalb des Intervalts [-1 p 1] lag. 

7. Vorrichtung zur Durchfuhrung des Verfahrens nach einem der 
Anspruche 1 bis 6, umfassend: 

- zwei Mikrofone (MIK1, MIK2); 

- eine an die Mikrofone angeschlossene Abtast- und Fourier- 
Transformationseinhert (20) zum Diskretisieren, Digitalisieren und 
Fourier-Transformieren der Mikrofonsignale (ml, m2); 

- eine an die Abtast- und Fourier-Transformationseinheit (20) 
angeschlossene Berechnungseinheit (30) zur Berechnung des 
Einfallswinkels (S) jeder Schallsignalkomponente; und 

- wenigstens einen an die Berechnungseinheit (30) angeschlossenen 
Signalgenerator (40) zur Ausgabe des separierten Schallsignals, wobei 
der wenigstens eine Signalgenerator (40) Mittel zum Muttiplizieren einer 
der Fourier-Transformierten (M1, M2) mit einer Filterfunktion (Fao) 
umfasst, die d-abhangig ist und unter Variation von d ein Maximum bei 
einem bevorzugten Einfallswinkel (d 0 ) aufweist. 

8. Vorrichtung nach Anspruch 7, dadurch gekennzeichnet, dass der 
Abstand (d) zwischen den Mikrofonen der Relation genugt: 

d<c/4f A 

wobei c die Schallgeschwindigkeit und f A die Abtastfrequenz der Abtast- und 
Fourler-Transformationseinhert (20) ist. 

9. Vorrichtung nach Anspruch 7 oder 8, dadurch gekennzeichnet, dass 
die Vorrichtung fur jede zu separierende Schallquelle (S1 , S2) einen Signalgenerator 
(40) umfalSt. 
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Fig. 2 
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